第三方發行版(如:CDH,HDP等)
1)優點:
i)基于Apache協議,100%開源。
ii)版本管理簡單清晰:像Cloudera的CDH4.1.0 patch level 923.142,表示在原生態Apache Hadoop 0.20.2基礎上添加了1065個patch。
iii)兼容性、安全性、穩定性強:第三方發行版通常基于穩定版的Apache Hadoop,并應用最新的補丁。同時,這些版本都經過了大量的測試驗證,有眾多的實際部署,且大量部署于各種生產環境,因此,比原生態Apache Hadoop擁有更好的兼容性、安全性和穩定性。
iv)版本更新快:例如:通常,CDH每季度會發布一個update,每年會發布一個release。
v)提供部署、安裝和配置工具:第三方發行版會提供方便易用的安裝部署和管理工具,這將不但大大提高集群部署的效率,同時后期管理和維護也會非常方便和高效。
2)缺點:
i)因為有些第三方版本會收費,這將會提高開發和運營成本。
ii)后期管理和運維都會涉及廠商鎖定問題。
三、第三方發行版間比較
1.Cloudera:目前發布最成熟的發行版本,擁有最多的部署案例,提供簡單、易用、方便、強大的部署、管理和運維工具,同時,Cloudera公司還開發并貢獻了可實時處理大數據的Impala項目。
2.Hortonworks:為使用100%開源Apache Hadoop的唯一提供商,Hortonworks首次使用Apache HCatalog的元數據服務特性,同時,其Stinger開創性、極大程度的優化了Hive項目。Hortonworks為使用者提供了一個友好、方便、易用、入門級的的沙盒工具。Hortonworks開發了很多hadoop增強特性并提交至核心主干,從而使得Apache Hadoop在Windows Server和Windows Azure等在內的Microsft Windows平臺上平穩高效的運行。